Analyse numérique : Au-delà de l'interpolation : La philosophie de l'approximation

L'interpolation suppose que les données sont parfaites. Dans le monde réel, les données sont désordonnées, instables et remplies de bruit. Lorsque nous exigeons que chaque point de données soit atteint exactement, nous ne découvrons pas la vérité — nous découvrons le chaos. Aujourd'hui, nous dépassons les exigences rigides de la précision pour adopter la philosophie de l'approximation.

L'échec de la précision

Bien qu'un polynôme de haut degré puisse passer par chaque point de données, il produit souvent des oscillations du type « Runge ». Ces variations violentes n'ont aucune ressemblance avec le processus physique sous-jacent. Il est donc irrationnel d'exiger que la fonction d'approximation coïncide exactement avec les données, surtout lorsque les mesures sont sujettes à des variations.

Définir le meilleur ajustement : Les trois normes

Pour approximer, nous devons définir une fonction d'erreur $E$. La manière dont nous mesurons la « proximité » change entièrement le résultat :

1. Le problème du minimax ($L_{\infty}$)

Recherche de la minimisation de l'erreur maximale possible :

$$E_{\infty}(a_0, a_1) = \max_{1 \le i \le n} \{|y_i - (a_1 x_i + a_0)|\}$$

Piège : La méthode minimax attribue généralement trop d'importance à un ensemble de données qui est fortement erroné.

2. Déviation absolue ($L_1$)

La somme des écarts absolus :

$$E_1(a_0, a_1) = \sum_{i=1}^{n} |y_i - (a_1 x_i + a_0)|$$

Piège : La fonction valeur absolue n'est pas différentiable en zéro, et nous pourrions ne pas être capables de trouver des solutions analytiques à ce système d'équations.

3. Suprématie des moindres carrés ($L_2$)

La norme standard en analyse numérique, en élevant au carré les résidus :

$$E_2(a_0, a_1) = \sum_{i=1}^{n} [y_i - (a_1 x_i + a_0)]^2$$

Cela crée une surface lisse et différentiable où le calcul différentiel peut facilement trouver un minimum global.

Contraintes analytiques

Choisir une métrique est un compromis entre logique et calcul différentiel. Par exemple, la méthode de déviation absolue ne donne pas assez d'importance à un point qui s'écarte considérablement de l'approximation, tandis que $L_2$ fournit un terrain solide qui pénalise fortement les points aberrants sans être entièrement dominé par un seul point erroné.

🎯 Principe fondamental

L'approximation est l'art d'ignorer le bruit pour retrouver le signal. En passant de l'ajustement ponctuel à la minimisation de l'erreur, nous retrouvons les lois physiques réelles masquées par les variations des mesures.

QUESTION 1

Pourquoi un polynôme d'interpolation de haut degré est-il souvent un mauvais choix pour les données expérimentales ?

Il est trop simple à calculer pour représenter la physique complexe.

It results in 'Runge-like' oscillations that capture noise rather than trends.

Il donne toujours un résultat linéaire qui ignore la courbure des données.

Il n'est pas différentiable en aucun point.

QUESTION 2

Quelle norme d'erreur est principalement utilisée dans le problème du minimax ?

Norme L1 (Somme des écarts absolus)

Norme L2 (Moindres carrés)

Norme L∞ (Erreur absolue maximale)

La norme de Gram-Schmidt

QUESTION 3

Quel est le principal inconvénient computationnel de la méthode de déviation absolue (L1) ?

Elle est trop sensible aux petits points aberrants.

Elle nécessite l'utilisation de polynômes de Chebyshev pour toutes les calculs.

La fonction valeur absolue n'est pas différentiable en zéro.

Elle ne fonctionne que pour les jeux de données comportant plus de 100 points.

QUESTION 4

Quelle norme établit un équilibre en pénalisant fortement les grands points aberrants, sans laisser une seule erreur dominer tout l'ajustement ?

Norme L1

Norme L2 (Moindres carrés)

Norme L∞

La norme de Runge

QUESTION 5

Dans l'exemple de chute libre, pourquoi utiliser un polynôme quadratique des moindres carrés plutôt qu'un polynôme de haut degré ?

Pour garantir que l'objet se déplace en ligne droite.

Pour capturer chaque vibration du support de caméra.

Pour ignorer le « tremblement » de la caméra et retrouver la loi physique de la gravité (y = at²).

Parce que les caméras haute vitesse ne peuvent pas enregistrer plus de 3 points de données.

Défi : Théorie avancée de l'approximation

Maîtrise des approximations de Padé et des moindres carrés discrets

La théorie de l'approximation s'étend aux fonctions rationnelles et à une analyse spécifique des données. Testez votre compréhension de ces concepts avancés.

Déterminez toutes les approximations de Padé de degré 2 pour $f(x) = e^{2x}$. Comparez les résultats pour $x = 0.2, 0.4, 0.6, 0.8, 1.0$.

Solution modèle :
Le développement en série de Maclaurin de $e^{2x}$ est $1 + 2x + 2x^2 + \frac{4}{3}x^3 + \dots$. Pour les approximations de Padé de degré 2, $R_{n,m}(x) = P_n(x)/Q_m(x)$ avec $n+m=2$ :

$R_{2,0}$ (Taylor) : $1 + 2x + 2x^2$
$R_{1,1}$ : $\frac{1+x}{1-x}$
$R_{0,2}$ : $\frac{1}{1-2x+2x^2}$

Pour $x=1$, $e^2 \approx 7.389$. $R_{2,0}(1) = 5$. $R_{1,1}$ est indéfini. $R_{0,2}(1) = 1$. Cela illustre que les approximations de Padé de bas degré ont des régions de validité spécifiques.

Étant donné $\phi_0(x) = 2$, $\phi_1(x) = x - 3$ et $\phi_2(x) = x^2 + 2x + 7$, montrez que tout polynôme quadratique $Q(x) = a_0 + a_1x + a_2x^2$ peut s'exprimer comme une combinaison linéaire $c_0\phi_0 + c_1\phi_1 + c_2\phi_2$.

Solution modèle :
Ceci est un problème de changement de base. Nous observons les degrés de $\phi_i$ : $\text{deg}(\phi_0)=0$, $\text{deg}(\phi_1)=1$, $\text{deg}(\phi_2)=2$. Étant donné qu'ils sont des polynômes de degrés distincts, ils sont linéairement indépendants dans $\mathbb{P}_2$.
1. $a_2x^2$ doit provenir de $c_2\phi_2$, donc $c_2 = a_2$.
2. Le terme linéaire $a_1x$ est ensuite correspondant à $c_1(x-3) + c_2(2x)$.
3. La constante $a_0$ est correspondante à $c_0(2) + c_1(-3) + c_2(7)$. Comme les coefficients dominants forment un système triangulaire, une solution unique pour $c_i$ existe toujours.

Supposons que les données de poids $F$ et de longueur $l$ sont : $F=[2, 4, 6]$, $l=[7.0, 9.4, 12.3]$. Trouvez la droite des moindres carrés $l = mk + b$ (ou $F = kl$).

Solution modèle :
Soit $x = F$, $y = l$. $\sum x = 12$, $\sum y = 28.7$, $\sum x^2 = 56$, $\sum xy = 127.4$. Équations normales : $3b + 12m = 28.7$ $12b + 56m = 127.4$ Résolution : $m = 1.325$, $b = 4.267$. L'approximation des moindres carrés pour la constante de raideur (si $F=kl$) impliquerait une droite passant par l'origine, mais les données suggèrent un décalage initial de longueur $b$.